## Loading required package: DBI
##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
##
## Attaching package: 'hms'
## The following object is masked from 'package:lubridate':
##
## hms
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
La meteorología es una ciencia que estudia los comportamientos de la atmósfera con un enfoque principal en la predicción del clima. Todas las condiciones climáticas conocidas son producto del calentamiento desigual de la tierra por medio de la magnitud radiación solar en el planeta en son con las rotaciones del planeta, sea sobre su eje o su órbita. La incidencia de la radiación solar genera cambios en dos variables que son primordiales para la realización de cualquier estudio meteorológico, la temperatura y la presión.
La radiación calienta las masas de aire elevando su temperatura, haciéndolas menos densas y disminuyendo su presión, este fenómeno genera espacios en la atmósfera de alta y baja presión, y en un natural esfuerzo por corregir esta desigualdad las masas de aire inician sus movimientos desde zonas de alta presión a las de baja presión. Desde este punto, ya se empiezan a generar fenómenos perceptibles fácilmente por el ojo humano, como la formación de nubes que, dependiendo del grado de humedad en el aire y la brusquedad de la incidencia de los frentes de alta presión, desencadenan riesgos reales sobre la zona geográfica afectada, mediante precipitaciones leves a tormentosas.
De esta forma, el montado de los sensores de este proyecto hacen registro de estas variables esenciales para cualquier esfuerzo de pronóstico meteorológico. Estas tres variables son:
Entendiéndose por “locales” a aquellos datos generados por los sensores montados cumpliendo el objetivo específico 1 del proyecto, ha de hacerse consulta al servidor de la carrera puesto a que en éste se encuentran centralizados los registros de los sensores De este forma habrimos conexión a la base de datos, solicitamos los registros y los guardamos en un dataframe
## Warning in .local(conn, statement, ...): Decimal MySQL column 2 imported as
## numeric
## Warning in .local(conn, statement, ...): Decimal MySQL column 3 imported as
## numeric
## Warning in .local(conn, statement, ...): Decimal MySQL column 4 imported as
## numeric
## Warning in .local(conn, statement, ...): unrecognized MySQL field type 7 in
## column 5 imported as character
Las advertencias explican que el tipo de datos de ciertas columnas fueron alteradas para poder ser utilizadas como dataframe, de la siguiente forma
Considerando, como en todo fenómeno físico, el tiempo como variable independiente del dataset, es que es de suma importancia asegurar el tipo de dato del momento de registro (CREATED) con tal de asegurar su consistencia para manipulación matemática Lo anteriormente dicho se refuerza en el hecho de que las variables climáticas son dependientes de la intensidad de la radiación solar, la cual se hace presente de forma cíclica a través del tiempo
Considerando que la exposición de la tierra al sol varía en ciclos de 24 horas y 12 meses es que se hace separación de los registros de hora y fecha
Se asegura la correcta importación de datos mediante chequeo de las primeras filas del dataset y la integridad de los tipos de datos mediante cálculo de estadísticas comunes
## ID REMOTE_ID AMBIENT_TEMPERATURE AIR_PRESSURE HUMIDITY CREATED
## 1 1 NA 25.71 1008.41 42.63 2021-04-10 21:39:30
## 2 2 NA 25.71 1008.46 42.63 2021-04-10 21:39:30
## 3 3 NA 25.71 1008.36 42.64 2021-04-10 21:39:30
## 4 4 NA 25.70 1008.37 42.65 2021-04-10 21:39:30
## 5 5 NA 25.71 1008.39 42.64 2021-04-10 21:39:30
## 6 6 NA 25.71 1008.35 42.65 2021-04-10 21:39:30
## dateUTC onlyTime onlyDate
## 1 2021-04-10 21:39:30 21:39:30 2021-04-10
## 2 2021-04-10 21:39:30 21:39:30 2021-04-10
## 3 2021-04-10 21:39:30 21:39:30 2021-04-10
## 4 2021-04-10 21:39:30 21:39:30 2021-04-10
## 5 2021-04-10 21:39:30 21:39:30 2021-04-10
## 6 2021-04-10 21:39:30 21:39:30 2021-04-10
## ID REMOTE_ID AMBIENT_TEMPERATURE AIR_PRESSURE
## Min. : 1.0 Min. :11.00 Min. :15.57 Min. :1006
## 1st Qu.:206.2 1st Qu.:12.00 1st Qu.:18.24 1st Qu.:1008
## Median :411.5 Median :12.00 Median :20.93 Median :1012
## Mean :411.5 Mean :11.81 Mean :21.12 Mean :1011
## 3rd Qu.:616.8 3rd Qu.:12.00 3rd Qu.:24.63 3rd Qu.:1013
## Max. :822.0 Max. :14.00 Max. :26.21 Max. :1016
## NA's :76
## HUMIDITY CREATED dateUTC
## Min. :39.31 Length:822 Min. :2021-04-10 21:39:30
## 1st Qu.:45.01 Class :character 1st Qu.:2021-05-15 20:55:17
## Median :55.56 Mode :character Median :2021-06-23 09:14:28
## Mean :54.03 Mean :2021-06-03 00:11:37
## 3rd Qu.:58.00 3rd Qu.:2021-06-23 20:00:15
## Max. :68.88 Max. :2021-06-23 23:04:42
##
## onlyTime onlyDate
## Length:822 Min. :2021-04-10
## Class1:hms 1st Qu.:2021-05-15
## Class2:difftime Median :2021-06-23
## Mode :numeric Mean :2021-06-02
## 3rd Qu.:2021-06-23
## Max. :2021-06-23
##
Para iniciar, consideramos que nos interesa estudiar la evolución de las variables climáticas a través del tiempo, por ende, es que para todo tipo de gráfico a realizar, las variables temperatura, presión y humedad tendrán un eje dedicado y dependiente del momento en que fueron registradas. Bajo esta premisa de estudio, es que son útiles las gráficas de línea y de puntos De esta forma iniciamos la visualización de datos graficando todos los registros de temperatura
Como se puede observar, los datos se encuentran dispersos y corresponden a registros diarios inconexos aunque con una ligera tendencia a la baja, por ende, es de mayor utilidad visualizarlos en un marco de 24 horas.
Hacemos zoom a las horas en que se ubica la mayor cantidad de datos.
De esta forma, exploramos mediante los mismos pasos la evolución de la humedad relativa y la presión atmosférica
Se puede observar que la humedad relativa tiende a aumentar en las épocas más frías del año a la vez que también aumenta en las horas nocturnas, sin embargo, no se puede confirmar su comportamiento periódico (ciclo cada un día) sin un registro continuo de 24 horas.
Teóricamente, a diferencia de la temperatura y la humedad relativa, la presión atmósferica se llega a dos máximos locales en un rango de 24 horas, primero y naturalmente en las horas de mayor exposición solar pues el calor disminuye la presión de las masas de aire sobre el agua, pero otra vez en las horas nocturnas, pues la drástica pérdida de calor de las masas de agua, disminuye la presión de las masas de aire también. Bajo este concepto, se procede a visualizar la evolución de la presión atmosférica al igual que en pasos anteriores
Se puede observar que la presión tiene tendencia a aumentar en las épocas más frías del año pero esta tendencia es menos clara que las presentes en temperatura y humedad relativa. Si es mas evidente su tendencia a aumentar pasadas las 14 horas del día pero de igual forma, no se puede asegurar su comportamiento periódico sin un registro continuo de 24 horas.
Analizado los cambios naturales de las variables en el tiempo es que ahora se procede a visualizar la relación entre las distribuciones de las variables. Considerando el pequeño tamaño del dataset es que se grafican las observaciones de forma cruda mediante puntos, utilizando una gradiente de colores para visuzalizar una tercera variable
En las gráficas se puede observar la formación de clústeres de datos, como en este caso el momento de creación de los registros no es de importancia, los registros actuales del set de datos son suficientes para afirmar la existencia de una correlación entre las variables climáticas las cuales, podrían ser las siguientes:
Con el fin de entender las diferencias de los datos locales con aquellos oficiales para la ciudad de Iquique es que se debe hacer uso de datos proveídos por la Dirección General de Aeronáutica Civil (DGAC). De forma preliminar, luego de inspeccionar los datos en su forma de texto se puede afirmar que son de calidad, pues a pesar de ofrecer cada variable climática mediante un distinto archivo .csv, todos estos archivos poseen la misma cantidad de registros tomados en momentos coincidente (tramos de cada 1 hora), lo cual facilita su mezcla y visualización > Del mismo modo que para datos locales, los datos de tipo fecha han de ser transformado de caracter a date para poder operar matemáticamente sobre ellos
Los gráficos de las observaciones se presentan para cada variable del siguiente modo:
temp <- read.csv("../data/2021/200006_2021_Temperatura_.csv",header = TRUE, sep = ";")
hum <- read.csv("../data/2021/200006_2021_Humedad_.csv",header = TRUE, sep = ";")
qfe <- read.csv("../data/2021/200006_2021_PresionQFE_.csv",header = TRUE, sep = ";")
dgac=merge(temp,hum,by="momento")
dgac=merge(dgac,qfe,by="momento")
dgac$utc<-dmy_hms(dgac$momento)
dgac$onlyTime<-as_hms(dgac$utc)
dgac$onlyDate<-date(dgac$utc)
rm(hum)
rm(qfe)
rm(temp)
En estas gráficas, debido a la mayor cantidad de registros se puede observar de forma clara los comportamientos que rigen las variaciones de temperatura:
En estas gráficas, debido a la mayor cantidad de registros se puede observar de forma clara los comportamientos que rigen las variaciones en la humedad relativa del aire:
En estas gráficas, debido a la mayor cantidad de registros se puede observar de forma clara los comportamientos que rigen las variaciones en la presión atmosférica: